L’objectif de cette cinquième série de modèles est de commencer à approcher la notion d’espace social grâce à des analyses factorielles (ACM).
L’espace social de la pauvreté monétaire et institutionnelle des données du Baromètre se structure en deux principaux axes dont l’interprétation (délicate) pourrait être la suivante :
| Gauche / Bas | Droite / Haut | |
|---|---|---|
| Axe 1 | Richesse monétaire et institutionnelle | Pauvreté monétaire et institutionnelle |
| Axe 2 | Ancrage dans la richesse / pauvreté | Vulnérabilité vis à vis de la pauvreté / halo |
Alors que le sentiment de pauvreté se situe davantage le long de l’axe horizontal, le sentiment de risque de pauvreté se situe davantage selon l’axe vertical, arguments qui permettent de conforter un peu l’interprétation faite de ces axes.
Voir les résultats statistiques plus bas.
#chargement des packages
library(knitr)
library(dplyr) #manipuler les bases de données
library(FactoMineR) #pour les analyses factorielles
library(explor) #contient FactoMineR
actives <- c("quantile_nivie", "presta_rsa","presta_chomage","presta_apl")
passives_autres <- c("revenus_financiers","revenus_locatifs","presta_handi","statut_occup", "diplome", "conn_rsa","annee_fac", "prof_statut_act", "age_tranche","vie_fam")
passives_subj <- c("subj_pauvrete","subj_risque_pauvrete", "subj_inf_mini_decla")
passives <- c(passives_subj,passives_autres)
bdd_acm <- bdd_logit %>%
select(c(all_of(actives),all_of(passives))) %>%
tidyr::drop_na()
res.mca <- MCA(bdd_acm,quali.sup=(length(actives)+1):(ncol(bdd_acm)),
graph=FALSE)
res <- explor::prepare_results(res.mca)
Les deux premiers axes de l’ACM (qui conservent respectivement 26 et 15 % de l’inertie) sont les suivants.
Le premier axe (horizontal) oppose clairement à droite les personnes pauvres monétairement (premier quintile de niveau de vie) et institutionnellement (RSA en particulier et APL et allocation chômage dans une moins mesure) et à gauche les personnes plus riches (Q3, Q4 et Q5, n’étant pas bénéficiaires de prestations sociales).
Le deuxième axe (vertical) apparaît plus difficile à interpréter. Avec les Q1 et Q5 qui sont au même niveau en bas et s’opposent au Q2. Une interprétation possible est que cet axe semble opposer les personnes très riches (Q5,Q4) ou très pauvre (Q1, RSA) en bas de l’axe à des personnes légèrement moins pauvres mais vulnérables, pouvant basculer dans la pauvreté en haut (Q2, au chômage).
explor::MCA_var_plot(res, xax = 1, yax = 2, var_sup = TRUE, var_sup_choice = NULL,
var_lab_min_contrib = 0, col_var = "Variable", symbol_var = "Type", size_var = NULL,
size_range = c(10, 300), labels_size = 10, point_size = 128, transitions = TRUE,
labels_positions = "auto", labels_prepend_var = FALSE, xlim = c(-1.42, 3.24),
ylim = c(-2.26, 2.41))
Axe 1
Axe 2
Ci-dessous quelques nuages des +11 000 individus colorés selon certaines variables catégorielles actives. On voit sur ce nuage uniquement une cinquantaine d’individus car nombre d’entre eux se ressemblent selon les variables actives (peu de variables et donc souvent mêmes modalités répondues).
Axe 1
Axe 2
Quand on regarde le nuage des individus, on se rend compte que l’interprétation de ces différentes variables de pauvreté sujective projetées en supplémentaires est délicate (ellipses se superposent beaucoup, en particulier pour les deux derniers). Mais s’il fallait interpréter leur centroïde uniquement, nous dirions quelque chose comme ce qui suit…
(ou plutôt richesse comme il s’agit des revenus financiers et locatifs).
Quand on les met en variables actives, elles déterminent un axe à elles seules de par leur spécificité. Je les ai donc gardées en supplémentaires.
En supplémentaires, ces deux variables se rapprochent de Q5. En revanche, l’absence de revenus de location et financier se rapproche du centre de l’ACP. C’est assez logique dans le sens ou ces types de revenus concernent des personnes fortunées.
Les professions et statuts d’emploi ont des positions assez marquées sur les axes de l’ACM comparées aux autres variables en supplémentaire.
Vie familiale et tranche d’âge se positionnent selon la même logique, en particulier selon l’axe horizontal.
Ce dernier graphique présente les dernières modalités, qui se démarquent peu sur cette ACM. Le graphique a d’ailleurs été zoomé car tout s’agglutinait au centre des deux axes. Quelques variables particulières à noter cependant :
Pour ces modèles quatre vagues du Baromètre ont été empilées : 2016, 2017, 2018 et 2019 (12 114 observations) mais seules 10 555 observations sont conservées (celles qui n’ont aucune variable manquante pour l’ensemble des variables utilisées, actives comme supplémentaires).